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摘要 目的 : 优化 人 乳头 瘤 病毒 16 型 主要 衣 壳 蛋白 L1 (human papillomavirus type 16 
major capsid proteinL1，HPV16L1) 在 毕 赤 酵母 中 的 表达 ， 并 考察 可 能 的 影响 因素 。 方 法 : 
四 个 不 同 序列 特征 的 HPV16L1 基因 M16, Y16, P16, W16 CHP, M16 和 Y16 按 酵母 密码 子 优 
化 ，P16 为 哺乳 动物 细胞 密码 子 优化 ， 而 WI6 为 野生 型 序列 ) 分 别克 隆 于 毕 赤 酵母 表达 质粒 
pPink"-HC (高 基因 拷贝 菌落 筛选 ) 和 pPink"-LC( 低 基因 拷贝 菌落 筛选 )， 并 转化 不 同 蛋 和 白 
酶 缺陷 的 宿主 菌 。 甲 酵 诱 导 24 小 时 后 ， 取 菌 体 样 品 经 Western Blot 分 析 L1 蛋白 的 表达 。 

结果 : M16 显示 了 最 高 的 表达 水 平 ， 其 次 是 Y16 与 P16， 而 W16 几乎 无 表达 。 基 因 序 列 密码 
子 应 用 特征 分 析 显 示 ， 四 个 基因 的 密码 子 适应 指数 从 高 到 低 依 次 为 Y16、M16、W16 和 P16。 

通过 自由 能 和 GC 含量 分 析 四 个 序列 的 mRNA 二 级 结构 ,Y16 为 - 409. 40 kcal/mol 和 43. 85%; 
M16 为 - 451.50 kcal/mol 和 47. 83%;P 16 为 - 606. 50 kcal/mol and 64. 10%;W16 为 - 384. 70 
kcal/mol and 38.01% 。 有 蛋白 酶 缺陷 菌株 L1 表达 高 于 野生 型 菌株 ， 质 粒 pPink"-HC 与 
pPink"-LC 介 导 的 表达 无 明显 区 别 。 结 论 : 密码 子 优化 操作 显著 改善 了 HPV16L1 在 毕 赤 酵母 
中 的 表达 , 但 表达 水 平 与 密码 子 利用 优 劣 并 不 完全 对 应 ,提示 密 码 子 优化 仅 是 部 分 原因 ， 而 
mRNA 结构 与 稳定 性 变化 值得 探讨 。 有 蛋白 酶 缺陷 菌株 提高 了 HPV16L1 蛋白 的 稳定 性 ， 显 著 影 
响 了 表达 水 平 。 在 本 研究 中 ， 基 因 剂 量 对 HPV16L1 的 表达 未 产生 明显 影响 。 
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甲醇 营养 型 毕 赤 酵 母 被 广泛 应 用 于 重组 异 源 蛋白 的 表达 后 。 作 为 单 细胞 真 
核 微生物 ， 它 具有 真 核 表达 系统 的 诸多 优势 ， 如 能 实现 外 源 蛋 白 的 分 泼 表达， 县 
有 真 核 表达 系统 的 翻译 后 修饰 如 糖 基 化 和 磷酸 化 等 功能 , 能 在 基本 培养 基 上 快速 
生长 ， 而 且 无 潜在 内 毒素 和 病毒 脱氧 核糖 核酸 的 污染 29。 此 外 ， 毕 亦 酵 母 能 实 
现 高 密度 生长 和 发 酵 ， 因 而 适合 于 大 规模 的 工业 化 生产 申 。 然 而 ， 并 不 是 所 有 的 
外 源 基因 都 能 在 毕 赤 酵母 成 功 表 达 , 通常 需要 对 表达 进行 优化 从 而 提升 外 源 基 因 
在 毕 赤 酵母 中 的 表达 水 平 目 。 在 这 些 优 化 策略 中 ， 密 码 子 优化 是 最 常 采用 的 方法 
之 一 。 密 码 子 优化 的 方法 基于 不 同 生物 对 各 种 密码 子 使 用 频率 的 差异 对 外 源 基 因 
进行 优化 ， 高 表达 和 蛋白质 中 的 高 频率 密码 子 相应 的 tRNA 的 丰 度 更 高 ， 这 种 对 高 
频率 密码 子 的 偏爱 使 得 蛋白 的 合成 速率 更 高 四 。 有 研究 报道 通过 密码 子 优化 方法 
实现 了 人 乳头 瘤 病 毒 主要 衣 壳 蛋白 工 1 的 高 效 表 达 [58。 此 外 ， 通 过 基因 重组 方法 
增加 基因 剂量 从 而 实现 基因 的 高 拷贝 和 通过 蛋白 酶 缺陷 菌株 提高 蛋白 质 的 稳定 
性 也 是 提高 蛋白 表达 的 常用 方法 外 。 在 本 研究 采取 了 多 策略 的 优化 方法 以 期 实现 
HPV16L1 在 毕 赤 酵母 中 的 高 效 表 达 。 
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1 材料 与 方法 

1.1 材料 

1.1.1 质粒 、 菌 株 与 宿主 菌 ” 真 核 毕 赤 酵母 表达 系统 PichiaPink™ 包括 表达 质粒 
pPink HC (高 拷贝 ) 、pPink LC《〈 低 拷贝 )、 表 达 用 宿主 菌 strains 1 一 4 购 自 美 
Invitrogen 公 司 (Invitrogen Inc. 5791 Van Alen Way Carlsbad,California 
92008,U.S.A), 根 据 酵母 密码 子 偏好 优化 的 HPV 16 LI 全 长 基因 序列 M16. Y16 
由 生 工 生物 工程 EH) 股份 有 限 公司 合成 ， 并 构建 质粒 PUC57; 哺乳 动物 细 
胞 密码 子 偏 好 优化 的 HPV 16 L1 基因 P16 由 质粒 p16shell (由 美国 国立 癌症 研究 
所 Dr. Schiller 提供 ) 通 过 PCR 扩 增 获得 , 携带 野生 型 HPV16 L1 基因 的 序列 W16 
由 本 室 (中 国医 学 科学 院 医 学 生物 学 研究 所 分 子 免 疫 实验 室 ) 保存 。 大 肠 埃 希 菌 
(E.coli) DH5a 购 自 宝 生物 工程 (大 连 ) 有 限 公 司 。 

1.1.2 主要 试剂 DNA marker, Taq Z RIH T4 DNA 连接 酶 、 限 制 性 内 切 酶 购 
AA TaKaRa 公司 ; 质粒 提取 试剂 使 和 DNA 凝 胶 回 收 试剂 盒 购 自 北京 天 根 生 
化 科技 有 限 公司 ; 酵母 提取 物 和 胰 蛋 白 腑 均 购 自 英国 OXOID 公司 ; 鼠 抗 HPV 16 


L1 单 克 隆 抗 体 及 HRP 标 记 免 抗 鼠 IgG 购 自 美国 Santa Cluz 公司 ; 显 色 底 物 Pierce 
ECL 购 自 美国 Thermo 公司 ;其 他 试剂 均 为 国产 分 析 纯 。 酵 母 生 长 培养 用 甘油 复 
合 培 养 基 BMGY 和 诱导 用 甲醇 复合 培养 基 BMMY 由 本 实验 室 自行 配制 ， 培 养 
基 配 方 中 均 分 别 含 1% 的 酵母 提取 物 ，2% 和 蛋白 肪 ，100mM 磷酸 盐 、1.34% YNB 
《酵母 氮 碱 )，4x104% 生 物 素 ，BMGY PE 1% 甘 油 ，BMMY FE 0.5% 甲 醇 用 
于 蛋白 的 诱导 。 
1.2 方法 
1.2.1 HPV16L1 不 同 基因 序列 的 设计 合成 和 重组 质粒 的 构建 

根据 Genebank 中 登录 的 氨基 酸 序 列 并 基于 毕 赤 酵母 密码 子 使 用 频率 设计 合 
成 M16[UniProtKB/Swiss-Prot: P03101.2] 和 Y16 [NC_001526.2] 的 基因 序列 , 设计 
过 程 中 避免 稀有 密码 子 (氨基酸 同 义 密码 子 的 使 用 频率 <0.1) 和 构建 过 程 中 使 用 
的 内 切 酶 位 点 ，M16 和 Y16 的 区 别 在 于 M16 的 密码 子 分 布 较为 均衡 ， 选 用 较 偏 
好 的 密码 子 ， 而 Y16 倾向 于 挑选 同 义 密码 子 中 使 用 频率 最 高 的 那个 密码 子 ， 全 
基因 序列 由 上 海 生 物 工程 有 限 公司 合成 ， 同 时 合成 引物 序列 ， 见 表 1。 以 携带 
HPV 16L1 不 同 序列 基因 的 质粒 DNA 为 模板 , 对 HPV16 L1 基因 进行 扩 增 。 反 应 
条 件 为 : 95 C 30s; 54 C 30s, 72 C 90s， 共 30 个 循环 。PCR 产物 经 1% 
琼脂 糖 凝 胶 电泳 鉴定 。 表 达 载 体 pPink HC BK LC 经 Bsa /EcoR1 Sph 1 和 KpnI 
酶 切 后 回收 载体 片段 , 和 经 同样 双 酶 切 处 理 的 PCR 扩 增 产物 在 TaDNA 连接 酶 作 
用 下 16C 连 接 过 夜 ， 转 化 DH5a 感受 态 细胞 ， 经 AMP'LB 琼脂 平板 筛选 阳性 克 
隆 并 测序 鉴定 。 
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#1. PCR 引物 序列 


Table 1. Primers used for the amplification of different versions of HPV16 L1 gene sequences 


引物 序列 (5' 一 3 ) 


酶 切 位 点 
WI6HC/LC-F AAGGTCTCGAATTCGAAACGATGTCTCTTTGGCTGCCTAGTGA Bsa 
WI6HC/LC -R GGGGTACCTTACAGCTTACGTTTTTTGCGTTTA Kpn 
PI6HC/LC- F CGGAATTCGAAACGATGAGCCTGTGGCTGC EcoR I 
PI6HC/LC- R GGGGTACCTCACAGCTTCCTCTTCTTCC Kpn 
MI6HC/LC-F CGGAATTCGAAACGATGTCATTGTGGCTACCTTCT EcoR I 
MI6HC/LC-R GTGCATGCTTACAGTTTCCTCTGTTTACGTTT Sph 
Y16HC/LC-F CGGAATTCGAAACGATGTCTTTGTGGTTGCCATCT EcoR I 
Y16HC/LC-R GGGGTACCTTACAACTTTCTCTTCTTTCTCTTAGCA Kpn I 


1.2.2 HPV16L1 重组 质粒 转化 PichiaPink" 毕 赤 酵 母 细胞 和 表达 

不 同 序列 特征 HPV16L1 基因 (M16、Y16、P16 和 W16) 构建 pPink HC 
和 LC 表达 载体 ， 经 测序 和 酶 切 鉴定 正确 的 重组 质粒 电 转 化 PichiaPink™ 不 同 菌 
株 。 酵 母 菌株 接种 于 5ml YPD 培养 基 过 夜 培 养 ， 然 后 将 过 夜 培养 物 转 接 至 含 
500mlYPD 的 2L 三 角 烧 瓶 中 ，30C280 rpm 培养 至 菌 体 ODeo=1.3~1.5, 4°C 
1,500 g 离心 5 分钟 分 离 菌 体 ,将 菌 体重 悬 于 冰 预 冷 的 灭 菌 双 蒸 水中， 按 上 述 步 
又 离心 菌 体 沉淀 ， 再 将 菌 体 重 悬 于 冰 预 冷 的 灭 菌 双 蒸 水 中 , 同样 条 件 离心 后 用 
1M 冰 预 冷 的 山梨 醇 重 悬 菌 体 ,再 次 同样 条 件 离心 , 菌 体 用 1.5ml 冰 预 冷 的 山梨 醇 
重 悬 ， 即 为 酵母 感受 态 细胞 。 重 组 质粒 在 电 转 化 前 用 Afl I 内 切 酶 进行 线性 化 处 
理 ， 取 5~20ug 线性 化 重组 质粒 ， 加 入 80 v1 上 述 制 备 好 的 酵母 感受 态 细胞 ， 
将 重组 质粒 和 感受 态 混 悬 液 加 入 预 冷 的 2mm 电 转 杯 中 ， 在 冰 上 放置 5 分 钟 ， 将 
电 转 杯 放 入 电 转 仪 (GenePulser Xecl1, Bio-Rad), 调整 参数 为 电压 1.5 kV/cm， 电 
容 50 pF 电阻 1299， 电 击 时 间 为 +5 msec。 静 置 1hr 后 将 内 容 物 涂 布 ade 平板， 
于 30C 培 养 4 一 7 天 进行 阳性 克隆 筛选 。 随 机 挑选 平板 上 的 白色 阳性 克隆 接种 至 
25m1 BMGY 培养 基 中 , 于 30C280 rpm 培养 至 0Duu= 3.0~3.5, 1500 g 离心 5 分钟， 
将 菌 体 沉淀 重 悬 于 2Sml BMMY 中 ， 于 30'C 280 rpm 诱导 24hr， 以 未 诱导 的 含 
表达 载体 的 菌 为 阴性 对 照 。 


1.2.3 重组 蛋白 表达 的 Western blot 分 析 

诱导 24hr 后 收获 菌 体 离 心 ， 样 品 经 12 % HY SDS-PAGE 分 离 后 ， 经 
Trans-blotsSD(Bio-Rad) 恒 流 150mA 1h 转移 至 0.45 u m 的 PVDF IRE, A 5% 
脱脂 奶粉 的 TBST(20 mM Tris-HCl, 0.05% Tween 20, pH 7.2) 于 室温 封闭 2 h; 加 入 
1:500 H TBST 稀释 的 鼠 抗 HPV16 L1 单 克 隆 抗体 (sc-2005, Santa Cruz), 室温 孵育 
2h; TBST 洗涤 3 次 后 ， 加 入 1:10000 用 TBST 稀释 的 HRP 标记 的 免 抗 鼠 IgG, 
in 1h; TBST 洗涤 3 次 后 ， 将 洗涤 后 的 PVDF IRH ECL(Pierce®ECL, 
Thermo, USA) 显 色 底 物 浸染 Smin，X JEJE AERA Hr i 


1.2.4 不 同 HPV16L1 基因 序列 密码 子 分 布 情 况 和 序列 特征 分 析 
为 了 分 析 基 因 序 列 密 码 子 不 同 分 布 情况 和 蛋白 表达 水 平 之 间 的 关系 ， 通 过 在 线 网 站 


(http://www.genscript.com/cgi-bin/tools/codon freq table) 引 用 毕 赤 酵母 密码 子 的 使 用 频率 表 ， 


并 通过 (http:/www.genscript.com/cgi-bin/tools/rare_codon analysis). 分 析 四 个 HPV16L1 基因 序 
过 


列 M16、Y16、P16、W16 密码 子 在 毕 赤 酵母 中 的 使 用 分 布 情况 ， 统 计 结 果 见 图 3。 通 


(http://rna.tbi.univie.ac.at/) 预 测 mRNA 折 车 自由 能 、 密 码 子 适应 指数 CAI (codon adaptation 


index) 并 进行 GC 含量 分 析 ， 结 果 见 表 2。 


2 ”结果 与 分 析 
2.1 HPV16L1 重组 质粒 的 PCR 及 酶 切 鉴定 

构建 后 重组 质粒 进行 PCR 鉴定 ， 产 物 经 1% 琼 脂 糖 凝 胶 电泳 ， 在 分 子 量 约 
1500bp 处 得 到 与 预期 分 子 量 大 小 相符 的 DNA 条 带 。 各 重组 质粒 经 双 酶 切 鉴定 ， 
目的 条 带 位 于 约 1500bp 左右 ， 与 预期 相符 。 


2.2 不 同 密码 子 优化 HPV16L1 基因 序列 在 毕 赤 酵母 中 的 表达 
2.2.1 HPV16L1 基因 序列 M16、Y16、P16、W16 在 pPink HC 中 的 表达 


HPV16 L1 基因 序列 M6、Y16、P16、W16 分 别 构建 表达 载体 bpPink HC 和 LC, 
转化 Strain1， 和 蛋白 诱导 表达 24hr 后 收集 样品 进行 Western blot 检测 ， 结 果 显 
IW, 毕 赤 酵 母 密码 子 偏好 优化 的 基因 序列 ML6 和 Y16 以 及 哺乳 动物 细胞 密码 子 优 
化 序列 P16 都 在 Stain 1 中 获得 了 有 效 表 达 〈 图 IAA 和 1B)， 目 的 香 白 分 子 量 在 
55KD 左右 ， 在 30-50KD 之 间 也 出 现 反 应 条 带 ， 可 能 为 降解 重 白 ， 因 为 在 无 目的 
基因 的 宿主 菌 对 照 中 该 分 子 质量 之 间 并 无 条 带 出 现 。 在 诱导 表达 的 6 个 单 菌落 
中 ，W16 只 有 一 个 达到 可 检测 水 平 (图 1 A)。 通 过 对 WB 反应 条 带 的 半 定 量 分 析 
发 现 ， 在 四 个 序列 中 ，M16 的 表达 水 平 最 高 ， 和 P16 相 比 , Y16 的 表达 水 平 略 高 ， 
而 在 P16 诱导 表达 的 6 个 单 菌落 中 , 其 中 2 个 的 表达 水 平 与 ML6 和 Y16 表达 水 平 
相当 ， 而 W16 的 表达 水 平 明显 低 于 其 余 序列 的 表达 水 平 ( 图 1 C)。 
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图 1 不 同 HPV16L1 基因 序列 在 毕 赤 酵母 中 表达 的 WB 结果 分 析 


Figure. 1 Immunoblotting analyses on expression of different gene versions of HPV16 L1 in P. pastoris. 
A: Expression of the L1 protein introduced by plasmid pPink HC. B: Expression of the L1 protein introduced by plasmid pPink LC. C: Semi-quantitative 
analyses of immunoblotting results for the expression of HPV16 Ll. Lanes 1-6: different colonies. “=p < 0. 001, compared to P16HC, Y16HC, 


Wl6HC and Y16LC; “= p < 0. 001, compared to MIGHC, P16HC, Y16HC, and YI6LC. 


2.2.2 HPV16L1 基因 序列 MI6、Y16、P16、W16 4 pPink HC 和 LC 中 的 表达 差异 


在 异 源 蛋 白 优 化 表达 过 程 中 ， 基 因 剂 量 是 另 一 个 需要 考虑 的 因素 ， 基 因 剂 量 
的 增加 可 能 会 增强 mRNA 的 转录 水 平和 丰 度 。pPink HC 和 pPinkLC 表达 载体 通过 
不 同 启动 子 强度 来 控制 选择 基因 ADE2 的 表达 ，pPink HC 使 用 弱 的 启动 子 ， 因 此 
只 有 多 拷贝 的 质粒 整合 才 会 使 转化 质粒 在 腺 嗓 哈 缺陷 培养 基 中 生长 ,而 pPink LC 
则 相反 ， 其 使 用 强 的 启动 子 ， 只 需 一 个 拷贝 的 基因 整合 即 可 使 转化 质粒 在 腺 嗓 哈 
缺陷 的 培养 基 中 生长 ， 因 此， 通过 两 种 不 同 的 质粒 可 以 达到 不 同 拷贝 表达 克隆 的 
fii 0G M16. Y16, P16, W16 分 别克 隆 于 pPink HC 和 pPinkLC, 诱导 表达 后 经 Western 
blot 检测 蛋白 表达 水 平 , 结果 显示 , M16. Y16, P16, W16 在 pPink HC 和 pPinkLC 
中 获得 了 相似 的 表达 水 平 (图 1B 和 图 1C), Y16 在 pPink HC 和 pPinkLC 中 的 表 
达 无 明显 差异 (图 1B 和 图 1C)， 所 有 优化 基因 序列 在 pPinkLC 中 获得 了 有 效 表 
iA (R 1B)， 提 示 基 因 剂 量 未 对 HPV16 L1 表达 产生 显著 影响 。 
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2.3 HPV16 L1 基因 序列 Y16 在 不 同 蛋白 酶 缺陷 株 中 的 表达 

Y16HC 重组 质粒 分 别 电 转化 pPink strain 1.2.3.4, strain 1 为 野生 型 ade2 
基因 敲 除 的 菌株 ， 其 余 菌 株 均 从 Strain] 改造 而 来 。Strain2 为 pep 4 敲 除 菌 株 ， 
为 蛋白 酶 A 缺陷 株 ，Strain3 为 prbl 基因 散 除 株 ， 导 致 其 蛋白 酶 B 合成 缺陷 ， 而 
Strain4 为 蛋白 酶 A FB 的 双 敲 除 株 , 即 prp7 和 pep 4 双 基 因 敲 除 。 诱 导 表达 24hr 
后 经 western blot 和 半 定 量 分 析 ， 实 验 重 复 三 次 ， 结 果 均 一 致 ， 代 表 性 结果 分 别 
见 图 2A 和 2B， 结 果 显 示 ，HPV16L1 基因 序列 Y16 在 蛋白 酶 A 和 B 双 缺 陷 的 
strain 4 中 获得 了 最 高 表达 。 


A Strain1 Strain2 Strain3 Strain4 
1 2 121412 12 


55kDa— 


Expression Ratio gJ 


2 3 
Strains 


图 2 HPV16L1 CY16) 在 pPink 不 同 蛋白 酶 缺陷 株 中 的 表达 


Fig 2. Expression of HPV16 (Y16) in different pPink strains 
A: Representative picture for immunoblotting and B: the semi-quantitative analyses for using host strains with different proteinase phenotypes. Lane 1 and 2 represented 


two different colonies. * = p < 0.05. 


2.4 HPV16L1 不 同 基因 序列 的 密码 子 分 布 情况 和 特征 分 析 

四 个 来 源 不 同 的 HPV16 L1 基因 序列 Y16、M16、P16 和 W16 的 密码 子 频 
率 分 布 统计 结果 如 图 5， 它 们 的 最 优 密码 子 数 分 别 为 338、266、139 和 252,W16 
中 含有 5 个 频率 低 于 20% 的 密码 子 ， 而 在 其 他 3 个 序列 中 这 一 频率 的 数字 为 0。 
序列 的 自由 能 预测 、GC 含量 和 密码 子 适 应 指数 (codon adaptation index,CAD 见 表 
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图 3 HPV16 L1 不 同 基因 序列 在 毕 赤 酵母 中 的 密码 子 频率 分 布 情况 


Fig 3. Codon frequency distribution of different gene versions of HPV16 L1 for expression in P. pastoris. 


表 2， 不 同 HPV16L1 基因 序列 特征 分 析 


Table 2. Structure characteristic analyses of mRNA for different versions of HPV16 L1 gene 


sequences 
Folding free 
—451.50 —409.40 —606.50 —384.70 
energy(Kcal/mol) 
GC% 47.826 43.853 64.097 38.011 
CAI 0.87 0.76 0.58 0.73 
3 讨论 


遗传 密码 子 的 简 并 性 即 同一 氨基 酸 对 应 多 个 密码 子 的 现象 使 得 同一 种 蛋白 
可 以 由 众多 的 同 义 基因 序列 所 编码 , 但 这 些 编码 相同 氨基 酸 的 不 同 密码 子 , 在 不 
同 物种 中 使 用 的 频率 并 非 完全 地 平均 分 布 , 绝 大 多 数 生物 倾向 于 只 利用 这 些 密码 
子 中 的 一 部 分 ， 密 码 子 优化 方法 正 是 基于 其 这 样 的 偏爱 性 。 尽管 密 码 子 优化 策略 
FRAN fe Fe OTN, 但 它 依然 是 最 为 广泛 使 用 的 提高 外 源 基 因 表 达 水 平 的 方 
去 。 本 研究 通过 将 四 个 HPV16L1 基因 序列 构建 pPinkHC 和 LC 载体 , 转化 strain 


nnd 


1 以 考察 HPV16 L1 和 蛋白 表达 水 平 ， 结 果 (图 1A) 显示 ， 和 其 他 基因 序列 相 比 ， 
M16 显示 了 最 高 的 表达 水 平 ,Y16 显示 了 比 P16 稍 高 的 表达 水 平 ，P16 中 有 两 个 
单 克 隆 达 到 了 和 M16 相 类 似 的 表达 水 平 ， 而 W16 的 表达 水 平 显著 低 于 其 他 基因 
序列 的 表达 水 平 。 为 了 探讨 密码 子 使 用 频率 分 布 和 表达 水 平 之 间 的 关系 ， 对 四 个 
HPV16L1 基因 序列 的 密码 子 分 布 频率 进行 了 统计 《图 3)， 结 果 显 示 ， 表 达 最 差 
的 W16 其 密码 子 分 布 频 率 和 M16 及 Y16 相 比 ， 除 了 有 5 个 频率 小 于 20% 的 密 
码 子 外 ， 其 余 密码 子 和 M16 和 Y16 相似 。M16 和 Y16 相 比 ， 其 密码 子 分 布 更 
为 均衡 ，M16 的 密码 子 之 中 ， 有 42 个 密码 子 的 使 用 频率 在 40% 以 下 ， 而 这 一 数 
FE Y16 为 0; M16 的 最 优 密码 子 数 是 266， 而 Y16 为 338，P16 为 哺乳 动物 细 
胞 密码 子 优化 基因 序列 ,与 M16 和 YY16 相 比 ， 其 拥有 最 少 的 最 优 密码 子 ，W16 
的 最 优 密码 子 数目 为 252 个 ， 而 P16 的 最 优 密 码 子 数目 为 139 个 。 Y16 拥有 最 
多 的 最 优 密码 子 数目 ， 应 该 获得 最 高 的 理论 蛋白 表达 量 ， 但 实验 结果 显示 M16 
拥有 最 高 的 蛋白 表达 水 平 , M16 与 Y16 相 比 , 其 拥有 较 少 的 最 优 密 码 子 数目 , 但 
其 密码 子 分 布 更 为 均衡 ，P16 为 哺乳 动物 细胞 密码 子 优化 的 基因 序列 ， 在 四 个 基 
因 序 列 中 ， 其 拥有 最 少 的 最 优 密码 子 数目 ， 但 其 在 毕 赤 酵母 中 也 获得 明显 高 于 
W16 的 表达 水 平 。 结 果 显示 ， 在 不 考虑 mRNA 结构 的 前 提 下 ， 优 化 序列 的 过 程 
中 并 没有 必要 使 用 那些 频率 最 优 的 密码 子 , 而 避免 使 用 那些 极端 的 稀有 密码 子 可 
能 对 提高 蛋白 的 表达 水 平 更 为 有 利 。 

密码 子 适 应 指数 (The codon adaptation bias, CAL) 是 用 于 对 优化 的 基因 序列 
进行 分 析 的 常用 指标 之 一 02, 它 用 以 指示 异 源 基因 与 目标 宿主 基因 之 间 最 优 密码 
子 的 接近 程度 ,数值 1 被 认为 是 最 佳 的 理论 值 。 当 一 个 外 源 基因 的 密码 子 与 目标 
宿主 偏爱 密码 子 越 接近 ， 即 CAT 越 接 近 理 论 值 1 时 ， 有 蛋白 翻译 效率 越 高 ， 将 获 
得 更 高 的 表达 水 平 。 在 研究 中 使 用 的 四 个 HPV16L1 基因 序列 中 ， 拥 有 最 佳 CAI 
指数 的 基因 序列 其 表达 并 不 是 最 优 的 ， 而 CAI 指数 较 低 的 P16 在 毕 赤 酵 母 却 获 
得 了 有 效 表 达 ,， 提示 密码 子 偏好 只 是 影响 表达 的 一 个 因素 , 不 能 简单 的 将 表达 效 
率 高 低 归 结 于 使 用 的 密码 子 频率 高 低 ， 其 间 因 密码 子 优化 而 改变 的 mRNA 二 级 结 
构 可 能 起 着 重要 的 影响 .然而 以 mRNA 二 级 结构 预测 指导 基因 表达 优化 具有 难度 ， 
缺乏 可 靠 的 理论 指导 。 自 由 能 的 预测 是 对 mRNA 二 级 结构 进行 分 析 时 常用 的 指标 ， 
他 反映 了 mRNA 稳定 性 特征 。 有 文献 报道 通过 自由 能 预测 基因 序列 的 mRNA 二 级 
结构 从 而 增加 目的 蛋白 的 表达 量 0353， 我 们 对 四 个 基因 序列 的 自由 能 进行 了 预 


测 ， 结 果 显 示 ， 自 由 能 预测 的 理论 数值 与 实际 的 蛋白 表达 水 平 并 不 相符 ， 因 此 不 
能 从 简单 的 自由 能 高 低 获 得 表达 效率 高 低 的 预 判 ， 这 期 间 可 能 得 考虑 mRNA 二 级 
结构 的 序列 分 布 , 蛋白 因子 的 结合 等 等 复杂 因素 。 基 因 剂 量 也 被 认为 是 影响 蛋白 
表达 的 关键 因素 , 通过 基因 重组 方法 在 选择 压力 下 挑选 高 拷贝 的 基因 重组 子 , 提 
高 mRNA 的 转录 水 平 ， 有 助 于 提高 蛋白 的 表达 量 ”。 本 研究 采用 商业 化 的 pPink" 
表达 系统 简化 重组 菌 的 科 选 ，pPinkHC 和 pPinkLC 表达 载体 通过 启动 子 的 强 弱 来 
控制 选择 基因 ADE2 (Adenine auxotrophy) 的 表达 ，pPinkHC 使 用 弱 的 启动 子 ， 
因此 只 有 多 拷贝 的 质粒 整合 才 会 使 转化 质粒 在 腺 呆 哈 缺陷 培养 基 中 生长 ， 而 
pPink LC 则 相反 。 结 果 显 示 ， 不 同 HPV16L1 基因 序列 均 在 pPinkLC 中 获得 了 表 
达 ，Y16 在 pPinkHC 和 pPinkLC 中 的 表达 无 明显 差异 。 鉴 于 pPinkHC 理论 上 保证 
了 高 拷贝 数 的 插入 , 因此 推论 , 基因 拷贝 数 对 HPV16L1 的 表达 并 未 产生 严重 影响 。 

本 研究 尝试 了 不 同 策略 提高 HPV16L1 在 毕 赤 酵母 中 的 表达 , 包括 密码 子 使 用 
情况 ， 基 因 找 贝 数 ， 蛋 白质 在 宿主 中 表达 时 的 稳定 性 。 研 究 结果 显示 ， 密 码 子 优 
化 显著 提高 了 HPV16L1 在 毕 赤 酵母 中 的 表达 ， 和 蛋白酶 缺陷 株 提 高 了 蛋白 的 稳定 
性 ， 从 而 提高 了 蛋白 的 表达 。 值 得 注意 的 是 ， 哺 乳 动物 细胞 密码 子 优化 的 基因 序 
列 P16 在 毕 赤 酵母 中 获得 了 比 野生 型 Wwe 更 高 的 表达 , 即使 它 拥 有 比 we 更 少 的 
最 优 密码 子 和 更 多 的 稀有 密码 子 ， 提 示 除 了 密码 子 因素 外 ， 还 需要 考虑 其 他 的 因 
素 ， 比 如 mRNA 二 级 结构 的 改变 以 及 由 此 导致 的 对 蛋白 质 功能 的 影响 等 ， 这 为 后 
续 的 研究 提供 了 思考 。 综 上 所 述 ， 该 研究 为 外 源 蛋 白 在 毕 亦 酵母 中 的 优化 表达 提 
供 了 有 益 的 参考 。 
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Abstract Optimization approaches have been shown in many published paper to be successful in 


improving the expression of a heterogenous gene in yeast cells, however, it is always needed to 


find out whether and how an approach works for the actual case. In the study, multiple strategies 
were tried for the efficient expression of HPV16 L1 in Pichia pastoris, including the use of four 
gene versions with distinct sequence features (M16 and Y16 optimized for Pichia pastoris cells, 
P16 for mammalian cells, and W16 from a wild type sequence, respectively), and the employment 
of plasmid vectors facilitating selection of colonies with high or low gene copy numbers and host 
strains with different proteinase deficiency. M16 showed the highest expression, followed by Y16 
and P16, whereas W16 was merely detectable. However, the codon adaptation order from high to 
low is sequentially Y16, M16, W16, and P16. The results indicate that the actually effective 
mechanism of codon optimization might not definitely attribute to codon adaptation. In addition, 
improving protein stability using specific proteinase-deficient host strains was also proved to be 
effective for L1 expression. In conclusion, The findings added useful information to our 
knowledge of optimizing expression of heterogeneous genes in Pichia pastoris cells. 
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